跳到主要内容

05-文字识别

前言

OCR印刷字体识别也广泛引用到我们生活中,例如商务人员经常用到的是什么名片识别,发票识别等。还有在图书馆中,我们经常需要摘录一些文章,都可能用到文字识别。现在社会流行的文字识别,一般是针对印刷体(例如书籍、发票、个人名片等等),手写体因为太千变万化了,所以市面上还没有一个很好的解决方案,但是印刷字体,字体基本上就是有限的那么多种,所以视觉识别印刷体准确率是非常高。
本节我们来学习如何识别印刷字体

OCR对图像文本的识别可以划分为三个步骤

  1. 文本检测,一张图片里面并不是所有地方都是填满字或者是整整齐齐的写在同一段里面,这时候需要对文本进行检测提取。

字符分隔,根据规则对中文字符或者英文字符进行分割成独立的单元

  1. 字符识别,对独立的单元做算法处理进行识别

积木块

序号积木块说明
1image.png对当前画面的文字进行识别,结果存放于数组

程序

案例:将画面中识别到的文字,并且播报出来
image.png

image.png